龙芯3A6000重磅发布,国产自主CPU的进击之路!
11月28日,在2023龙芯产品发布暨用户大会上,国产CPU厂商龙芯中科正式发布了3A6000处理器。一般行业的普遍观点认为,自主研发的CPU性能和指令系统生态肯定比不上引进国外X86和ARM技术。但是龙芯正在打破这一固有观念。据龙芯介绍,在相同工艺下3A6000处理器的性能比上一代产品大幅提高,而且达到酷睿10代四核CPU水平。龙芯3A6000已然走出了一条基于成熟工艺,通过设计优化提升性能的道路。
众所周知,CPU和操作系统(OS)是信息产业的底座,但除此之外,还有更底层的“根技术”被“卡脖子”。如系统、IP授权,芯片生产工艺及其材料设备(光刻机)禁运等等,国产芯片发展之路困难重重。对此,龙芯中科选择的道路是将自主进行到底,从基于自主IP的芯片研发和自主指令系统的软件生态等方面夯实自主信息产业基础,不依赖国外授权和供应链。
然而,龙芯的志向远不止于此,龙芯中科董事长胡伟武在会后的采访中告诉笔者,过往的种种经历告诉我们,企业的发展不能过度依赖政策性市场,“到中流击水”,“中流”就是开放市场。龙芯要去更广阔的开放市场中去竞争,搏得一席之地。
龙芯3A6000处理器:完成通用处理性能“补课”,补齐所有差距
作为国产CPU勇闯无人区的龙芯中科,早在2013年,就已经清晰的认识到自主CPU与国外先进水平的主要性能差距在哪?首先,自主CPU是通用处理能力不行还是专用处理能力不行?答案是通用能力不行,需要用SPEC CPU而不是Linpack衡量。其次,自主CPU是单核性能不足还是核数不够?答案是单核性能不足,一群小学生谈不上“人多力量大”;最后,自主CPU是设计能力不行还是工艺不行?答案是设计能力不行,当时龙芯3A1000主频差距2-3倍,每GHz性能差距4-6倍。
龙芯中科董事长胡伟武
十年后的今天,龙芯3A6000已将上述差距完全补齐。2002年推出的龙芯1号与市场主流产品(相比当时的Pentium 4)性能相差20多倍,2021年推出的龙芯3A5000与市场主流产品性能相差不到1倍(与第3代四核酷容相当),2023年推出的龙芯3A6000达到市场主流产品水平(与第10代四核酷睿相当)。“自主研发的CPU没有天花板,可以在市场中不断迭代。”胡伟武在会上指出。
龙芯3A6000处理器采用龙芯自主指令系统龙架构(LoongArch),是龙芯第四代微架构的首款产品,主频达到2.5GHz,集成4个最新研发的高性能LA664处理器核,并突破同时多线程技术(SMT2),SMT是主流桌面/服务器CPU的标配技术。全芯片共8个逻辑核。集成安全可信模块,可提供安全启动方案和国密(SM2、SM3、SM4等)应用支持。
根据中国电子技术标准化研究院赛西实验室测试结果,龙芯3A6000在2.5GHz频率下,SPEC CPU 2006 base单线程定/浮点分值分别达到43.1/54.6分,多进程定/浮点分值分别达到155/140分;SPEC CPU 2017 base单线程(rate1)定/浮点分值分别达到5.05/7.78分,单进程多线程(speed)定/浮点分值分别达到6.66/18.1分,多进程(rate8)定/浮点分值分别达到21.3/21.0分;Stream实测带宽超过42GB/s;Unixbench实测超7400分。综合相关测试结果,龙芯3A6000处理器总体性能与英特尔公司2020年上市的第10代酷睿四核处理器相当。这充分证明了自主研发CPU的性能完全可以赶上并超过国际主流产品水平。
龙芯3A6000与龙芯3A5000等龙架构处理器软件兼容。统信、麒麟等操作系统企业在持续兼容的基础上均对龙芯3A6000新特性进行全面支持。龙芯3A6000还完善了对软硬协同的二进制翻译的支持,可提高二进制翻译效率,运行更多种类的跨平台应用,满足各类大型复杂桌面应用场景。
在会上,包括同方计算机、联想开天等在内的50余家合作伙伴发布基于龙芯3A6000的桌面计算机、笔记本、板卡、存储产品、网络安全设备、工业控制计算机等产品。
龙芯如何赢下巨头环伺的开放市场?
“2013~2015年,龙芯中科经历了3年的从技术派到政策性市场的第一次重要转型,彼时由于失去政府项目的支持,迫使公司摆脱了对政府项目的依赖,打开了政策性市场;历史总是惊人的相似,2022年,由于以电子政务为代表的政策性市场的停滞,迫使我们开展2022~2024年的第二轮转型,摆脱对政策性市场的依赖,到’中流击水’,意在打开充分竞争的开放市场。”胡伟武在会后采访中指出。
那么,龙芯这一次又将如何来赢得开放市场的一席之地呢?据胡伟武的介绍,龙芯的策略是点面结合。
所谓的“面”是指产品平台和生态建设,体现为通用CPU芯片性价比的提高和软件生态的完善。
(一)龙芯的Tock“三剑客”
在产品平台层面,龙芯将此次发布的桌面处理器龙芯3A6000、在研服务器处理器龙芯3C6000和移动桌面终端处理器2K3000等第四代产品当做是Tock“三剑客”:
目前龙芯已经完成其新一代处理器龙芯3C6000设计,它拥有16核心32线程(型号为LA664),相比前代产品,其通用处理性能有了成倍的提升。在内存方面,它支持DDR4-3200x4,访存带宽比上一代的3C5000成倍提高。提供PCle4 × 64接口,其性能相较于3C5000有数量级的提升。支持高性能国密标准加解密算法:SN4带宽>30Gbps。通过龙链技术 (Loongson Coherent Link)实现片间互连。龙芯3C6000系列包括IS3D6000双硅片版本,拥有32核心和64线程,以及LS3E6000四硅片版本,拥有64核心和128线程。龙芯3C6000还支持GPGPU和各类加速器的扩展,这意味着它不仅适用于通用计算任务,也能够高效地处理图形和其他特殊类型的计算需求。
3C6000突破了片间高速互联技术——龙链。谈及龙链技术,胡伟武对笔者表示,PCIe是常用的IO总线,它可以接各种卡,如网卡、显卡等。而CPU与CPU、GPU与GPU之间的互联不需要有这样复杂的协议,重要的是要连的快。我们为什么打不过国外,在互联方面,英伟达有NVLINK,英特尔有CXL,此次,龙芯的互联技术龙链将是对国内的又一大贡献。龙链是龙芯全自研的物理层接口,兼容PCIe电气标准,比用PCIe等IO总线能够大幅降低延迟,提高带宽效率。它将支持龙芯高速缓存一致性协议传输,而且可扩展性强,物理层接口易于更换、升级。
除此之外,龙芯的移动桌面终端处理器2K3000也已完成前端设计,这是一款面向笔记本/云终端的八核单硅片SoC,具有极高的性价比。集成八个L4864处理器核,单核性能与3A5000可比,集成自研LG200 GPGPU核,支持图形加速、科学计算加速、Al。2K3000还集成自研密码模块。并具有丰富的IO接口,如PCIe、SATA3、 USB3、GMAG、HDM等。
道生一、一生二、二生三、三生万物。待龙芯的这“三剑客”全面研制成功后,龙芯CPU将在特定的开放市场取得一定竞争力,助力龙芯开辟更广阔的CPU市场。
(二)开放LA架构指令,与x86和Arm“三足鼎立”
目前我国的IT行业主要建立在两大体系之上:一是x86 CPU和Windows操作系统控制了桌面和服务器等市场,二是Arm CPU和Andriod操作系统控制了移动终端及工控等市场。指令系统是软件生态的基础。x86不对外开放,Arm是广泛的CPU授权指令集,但是Arm授权不允许加指令,自行增加指令要符合技术规范,只能通过开放库方式使用,限制创新。“这就好比在别人的墙壁上砌房子,再大再漂亮也经不起风雨,甚至会不堪一击。”自主生态只能靠自己建,不能靠跟着走。
对此,龙芯打算开启生态建设新征程,构建与x86体系和Arm体系“三足鼎立”的第三套自主信息技术体系。
2020年,龙芯推出LoongArch龙芯指令系统架构(简称龙架构或LA架构)。在政策性市场的带动下,基于龙架构的基础软件生态基本建成。但一枝独秀不是春、百花齐放春满园。在本次大会上,龙芯宣布,公司正在考虑未来将龙架构指令系统开放授权。
龙架构开放授权的特点和优势是门槛低且无无版税。胡伟武表示,龙芯IP采用一次性授权,永不收版税。目前正在起草技术规范协议,并公开征求意见,只要签署该技术协议,即可获得永久授权。在本次发布会上就有十家合作伙伴使用龙芯CPU核心进行芯片研发签约。
胡伟武在会后也告诉笔者:“只要你按照龙芯的指令集规范,你可以任意加指令集,而且能保证各个应用上兼容。要做好龙架构开放授权这项工作,软件需要做的工作很多。”
近年来RISC-V指令集的呼声较高,成为国内发展CPU的一条新途径,对于RISC-V,胡伟武谈到,RISC-V过度开放,存在生态碎片化,软件不兼容的一些掣肘,比较适于垂直市场来做。胡伟武进一步表示,龙芯的生态,在桌面型和服务器方面相比RISC-V已经具有一定的优势。
龙架构原生支特Linux平台全部主流基础软件和应用环境,x86、Arm有的,龙架构也有;而且龙架构克服了Linux生态碎片化的缺点,实现不同分支及版本Linux(如统信、麒麟)的应用兼容。目前龙架构已经得到与指令系统相关的主要国际软件开源社区的支持,包括国内统信、麒麟、欧拉、龙蜥、开源鸿蒙等操作系统,以及WPS、微信、QQ、钉钉、腾讯会议等基础应用的支持。
龙架构还能实现与x86和Arm的兼容。龙芯3A6000完善了对软硬协同的二进制翻译的支持,可提高二进制翻译效率,运行更多种类的跨平台应用,满足各类大型复杂桌面应用场景。
“点”的工作主要是对细分市场的聚焦,面向开放市场进行重点突破。龙芯目前已经有了很好的技术和市场积累, 在开放市场有竞争力,在政策性市场就更有竞争力。此次的打印机芯片就是龙芯“点”工作的一个突破。
多数的打印机只有Windows驱动,而没有Linux驱动,龙芯的打印机芯片龙芯2P0500破解了困扰Linux桌面几十年的打印机驱动问题。龙芯2P0500是一款适用于单/多功能打印机的主控SOC芯片。该芯片采用异构大小核结构,集成DDR3内存、GMAC、OTG等多种功能模块,具有打印数据接收、解析和处理,打印引擎控制,扫描时序控制,数据扫描,图像处理,马达控制等功能,单芯片即可满足打印、扫描、复印等多种典型应用需求。在龙架构的Linux平台上可以驱动95%以上的打印机。在本次大会上,共有12家打印机厂商与龙芯中科签订协议,共建国产打印机新生态。
综上,通过“点面结合”的策略,不断提高芯片性价比、完善软件生态、优化解决方案,到中流击水,龙芯在开放市场必有一席之地。而所有的这些工作背后,离不开龙芯人的努力。“龙芯现在总共有一千多人,这一千人至少干了一般企业五千人的活儿。龙芯的团队是一个有情怀的团队,龙芯要为人民做龙芯”胡伟武表示。一支队伍、一个目标、咬紧牙关、长期坚持,通过长期积累和迭代,将自主化的优势转化为性能和生态的优势!
写作最后
国产CPU发展之路道阻且长,但也充满希望。相信在龙芯的带领之下,再结合上下游产业链的大力支持,国产CPU一定能够取得更大的进步,实现自主可控。借用胡伟武在会上最后的演讲:“我们正在前进。我们正在做我们的前人从来没有做过的极其光荣伟大的事业。我们的目的一定要达到。”
推荐阅读
英伟达,独孤求败
干掉硅中介层?
英伟达中国版芯片,延期?
关注全球半导体产业动向与趋势
欢迎关注【半导体芯闻】
公众号ID:MooreNEWS